单细胞数据中到底应该如何处理线粒体基因
分享是一种态度
作者 | 周运来
男,
一个长大了才会遇到的帅哥,
稳健,潇洒,大方,靠谱。
一段生信缘,一棵技能树,
一枚大型测序工厂的螺丝钉,
一个随机森林中提灯觅食的津门旅客。
什么是线粒体基因
线粒体是参与细胞凋亡启动和执行的主要细胞器之一。线粒体基因在大多数细胞中表达,其表达水平是细胞类型特异性的。也就是说这个也是和细胞类型及其状态有关系的。
为什么要处理
因为线粒体基因的高表达水平可能是:
样品质量差,导致大量细胞凋亡或裂解。 特定样本的生物学,例如肿瘤活检,可能由于代谢活动和/或坏死而增加线粒体基因表达。
凋亡细胞表达线粒体基因,并将这些转录产物输出到哺乳动物细胞的细胞质中。例如,当凋亡的细胞被放入正常的细胞悬液中,会检测到更多的线粒体基因。检测到的线粒体膜占总膜的百分比如图所示
线粒体是参与细胞凋亡启动和执行的主要细胞器之一。细胞凋亡的过程依赖于一系列信号事件,包括线粒体基因表达的增加和半胱天冬酶的激活。因此,我们在计算每个样本中源自线粒体基因表达的UMIs数量时,评估了独特转录本的比例。在> 80%活细胞的高质量样品中,我们只检测到低比例的线粒体细胞(约3%)。与预期的一样,在只包含20%活细胞(74%)的Digitonin高样本中,线粒体转录本的数量最高。相比之下,含有50%活细胞的样本只显示线粒体基因表达略有增加(5-7%),这表明存活率确实与观察到的线粒体转录本数量相关。
被裂解的细胞或细胞膜被破坏的细胞释放它们的细胞质转录本,而线粒体转录本可能仍然保留在双膜结合的线粒体内。具有完整线粒体的裂解细胞可能被gems包裹,这也增加了检测到的线粒体转录片段的概率。
如何处理
一般我们建议卡到30%以内,当然还是要看这群细胞为什么会高。建议是不卡阈值直接做降维分群,然后按分群来看小提琴图,如果只有一个或几个细胞群有差异的线粒体转录上调和低总UMI计数,这个群最有可能代表一个死亡或频临死亡的细胞群。此时,再去不迟。
另外一点,我们注意到,cellranger3比cellRanger 2检测的MT(人的是MT开头的基因,其他物种主要找到相应的基因)高的细胞更多。这主要是因为:cellRanger3或更高版本具有比版本2中的cell calling算法更敏感,新算法基于EmptyDrops方法(Lun et al., 2018)。这种方法可以检测到之前版本算法所遗漏的细胞,特别是死亡或垂死的细胞,RNA含量自然较低的细胞,或异质性样本中的细胞。
这就也是为什么我们会主动地看看细胞中MT基因表达的原因,选择从下游分析中排除这些细胞。而在cellranger count管道中,没有直接的方法可以排除线粒体丰富的细胞。但是,您可以使用下面两种方法中的任何一种来间接完成此任务。
Using Cell Ranger and Loupe Cell Browser
质量差的细胞通常有低总UMI计数,很少有上调基因(表明低总基因表达),而只有MT基因过表达。例如,在下面的图中,您可以看到基于图形的聚类t-SNE图中聚类1(顶部的青色聚类)的基因表。与上述鉴定死亡细胞的标准一致,在这个群集中只有线粒体基因上调。对cluster 9中的细胞也进行了类似的观察。
下面的图显示,与其他细胞相比,Cluster1和Cluster19中的细胞的总UMI计数也很低。
您可以从一个cellranger count 输出文件中获得Cluster1和9中细胞的条形码。默认的分群结果(基于图)在Cell Ranger输出的“ANALYSIS”路径中。例如,在下面的图中,cluster 1和cluster 9的细胞高表达了MT。这些cluster的条形码可以在输出文件中找到:outs/analysis/clustering/graphclust/cluster.csv
您也可以使用Loupe细胞浏览器下载的非MT丰富细胞。为此,首先去除富集MT的cluster1和9。然后使用“导出”功能在Loupe Cell浏览器如下。
步骤2。使用cellranger reanalyze重新运行二级分析并生成一个新的cloupe文件,不使用MT高表达的barcode。要指定条形码,需要使用——barcodes选项。
Seurat
第二种方法就是我们经典的Seurat。第三方工具如Seurat可用于筛选线粒体基因表达率高的细胞。请在这里(http://satijalab.org/seurat/pbmc3k_tutorial.html)找到更多的信息。(章节“QC和选择细胞进行进一步分析”)
References
[1]
单细胞转录组||Seurat新版教程:Guided Clustering Tutorial: https://www.jianshu.com/p/03b94b2034d5[2]
https://kb.10xgenomics.com/hc/en-us/articles/360001086611-Why-do-I-see-a-high-level-of-mitochondrial-gene-expression-[3]
https://kb.10xgenomics.com/hc/en-us/articles/360026505392-Why-do-I-see-more-MT-enriched-cells-from-Cell-Ranger-3-compared-to-Cell-Ranger-2-[4]
https://kb.10xgenomics.com/hc/en-us/articles/360026508452-How-can-I-exclude-poor-quality-cells-such-as-cells-that-show-enrichment-of-MT-genes
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
生信爆款入门-第7期(线上直播4周,马拉松式陪伴,带你入门)你的生物信息入门课
数据挖掘学习班第5期(线上直播3周,马拉松式陪伴,带你入门) 医学生/医生首选技能提高课
生信技能树的2019年终总结 你的生物信息成长宝藏
看完记得顺手点个“在看”哦!
长按扫码可关注